АГРЕГИРОВАНИЕ ВЕРОЯТНОСТНОЙ И НЕЧЕТКОЙ
ИНФОРМАЦИИ В ЗАДАЧАХ ОЦЕНКИ РИСКА
В.В. Костерев*, А.Н. Аверкин**
* Московский государственный инженерно-физический институт
** Вычислительный центр РАН
Abstract - Aggregation method for correct risk assessment in presence of statistical and fuzzy values was worked out using probability - possibility conversion.
Анализ, оценка и управление риском связаны с использованием неопределенной информации и математических моделей, адекватность которых, как правило, оценить затруднительно. Это может быть источником существенных трудно прогнозируемых погрешностей. Оценки риска, как правило, основываются на вероятностном подходе, базирующимся на теории вероятностей. Этот подход в большинстве случаев зависит от моделей, использующих логические структуры: дерево событий, дерево отказов. Неопределенность входных параметров может быть обусловлена ошибками измерений, интерполяции или экстраполяции, дискретизации и аппроксимации, различных допущений, вариабельностью и т.п. Одним из широко распространенных подходов для описания неопределенности входных параметров является использование плотности распределения вероятностей. Для большинства задач оценки риска это является приближением, которое вносит дополнительный вклад в неопределенность наряду с использованием дерева событий и дерева отказов, а также допущений (которые на практике зачастую оказываются необоснованными). Анализ "непредвиденных" аварий и катастроф показывает, что во многих ситуациях выводы, базирующиеся на анализе риска, были чрезмерно оптимистичными. Неопределенности, соответствующие экстремально редким событиям, являются еще более чувствительными в плане анализа и оценки и, следовательно, предполагают еще более осторожный подход. Использование методов нечеткой алгебры для оперирования с переменными, которые не могут быть отнесены к разряду случайных, а являются по своей природе нечеткими, дает принципиальную возможность адекватного ответа на возникающие при использовании таких переменных проблемы. Одной из важнейших задач при этом является агрегирование информации.
В случае случайных переменных функции распределения результатов (плотности распределения вероятностей) могут быть получены из исходных плотностей распределения вероятностей. Так, плотность распределения вероятностей суммы двух независимых случайных переменных, имеющих плотности распределения вероятностей соответственно р
1 и р2, определяется как [1],
(1)а для произведения двух независимых случайных переменных как
.
(2)В ряде случаев плотности распределения вероятностей случайных переменных получают с использованием вычислений Монте-Карло.
В случае нечетких переменных одним из подходов является определение операторов агрегирования информации (пересечения и объединения ) в классе треугольных норм и конорм [2]. При этом, как правило, не делается предположений о взаимосвязи параметров и их независимости. Таким образом, операции над нечеткими переменными часто соответствует ситуации, когда информация о вероятностях параметров отсутствует и/или не может быть постулирована (более общий случай). Вероятностный же подход, напротив, ограничивается случаями, когда (вероятностные) характеристики параметров хорошо известны (частный случай). Кроме того, использование формул (1) - (2) предполагает независимость параметров, что на практике далеко не всегда выполняется.
Нечеткие модели могут быть использованы и для описания неопределенностей в вероятностном анализе [3], однако, нечеткие вычисления отличаются от вероятностных математически и концептуально и более соответствуют случаям, когда плотности распределения вероятностей неизвестны. Подобная ситуация характерна для задач определения надежности технических систем и оценки риска.
Во многих случаях риск является функцией как статистических параметров, так и нечетких. В силу различия теорий, используемых для описания этих двух типов параметров, (теория вероятностей и, например, теория возможностей) задача их агрегирования становится нетривиальной. Для ее решения необходимо преобразование параметров к одному типу. Это предполагает трансформирование либо плотности распределения вероятностей р в распределение возможностей
r, либо наоборот r в р. Причем, при подобных преобразованиях должно сохраняться количество информации (неопределенности) в распределениях р и r. С использованием результатов работы [4] разработаны программные продукты для преобразования распределения вероятностей р в распределение возможностей r а также r в р. В качестве меры неопределенности использована максимальная величина шенноновской энтропии среди всех распределений вероятностей, совместимых с данной функцией доверияAU(Bel)=max{pxlog2px},(3)
где AU(Bel) - количество неопределенности, содержащееся в функции доверия,
px - функция распределения вероятностей, максимум берется среди всех { px }xОX , так что px[0,1] для всех xОX,px=1, и для всех АОX, Bel(A) px. X={x1,x2,...,xn} - ограниченное непустое универсальное множество c мощностью P(X), А - подмножество множества X.
В силу не единственности преобразования "вероятность-возможность" используется дополнительно еще одна мера неопределенности - неспецифичность N. Для заданного пространства рассуждений (m, F)
N(m) =m(A)log2кAк, (4)
где N(m) - мера неспецифичности, содержащаяся в m, F - набор фокальных элементов, ассоциированных с m, m - базовое распределение вероятностей: функция, вводимая в теории Демпстера - Шеффера
m:P(X)®[0,1], так чтоm(A)=1.(5)
Величина m(A) выражает степень доверия в утверждении, которое представлено множеством А, но она не включает возможную степень доверия в дополнительных утверждениях, представленных различными подмножествами А. То есть, m(A) выражает степень доверия, которая соответствует точно множеству А, а не степень полного доверия, соответствующего А. Чтобы получить последнее, необходимо к m(A) добавить значения m(В) для всех подмножеств В множества А. Полное доверие, соответствующее А, выражается формулой Bel(A) =
m(A). кA кв формуле (4) есть размерность множества А. В теории возможностей мера неспецифичности может быть выражена через распределение возможностей r(r1,r2,...,rn) формулойN(r) =ri log2 (i /(i-1)). (6)
В зависимости от контекста задачи выбирается решение, минимизирующее или максимизирующее значение
r. Например, если распределение возможностей будет использовано для принятия решений, целесообразно стремиться к максимальной точности - наиболее характерному решению (минимальная неспецифичность). В случаях, когда распределение возможностей будет использовано для последующего анализа, ограничения, накладываемые на него, должны быть лишь необходимыми и, следовательно, целесообразно использовать максимально неспецифическое решение.В качестве примера рассмотрим получение оценки риска перевозки ядерных энергетических установок из Москвы до ст. Тюратам (Казахстан). Использованы оценки по происшествиям, приведенные в работе [5]. Предполагается, что возможность схода состава с рельсов описывается распределением возможности
r1 треугольной формы с r1min = 0.5ґ10-3, r1mean = 0.425ґ10-2, r1max = 1.7ґ10-2. В качестве другого параметра нами выбрана вероятность террористической акции на маршруте следования. Предполагается, что плотность распределения вероятностей p2 для этого параметра подчиняется распределению Симпсона с p2min = 3.24ґ10-3, p2mean = 1.08ґ10-2, p2max = 1.84ґ10-2. Плотность распределения вероятностей p2 с использованием разработанного программного продукта преобразовывалась в распределение возможностей r2(max), соответствующее максимальной неспецифичности. Это распределение приведено на рис. 1.Оценка результирующего риска транспортного инцидента, который в нашем случае включает риск схода с рельсов и риск террористической акции на маршруте следования, представлена результирующей функцией распределения возможностей
r. Эта функция получается путем агрегирования функций распределения возможностей r1 и r2(max). В качестве оператора агрегирования информации используется t-конорма Лукасевича SL[r1, r2(max)] = min[1, r1+ r2(max)]. Результирующая функция распределения возможностей транспортного инцидента приведена на рис. 2. Ее анализ показывает, что наиболее ожидаемым значением является 0.50ґ10-2, возможный разброс 0.5ґ10-3 - 1.84ґ10-2.Для оценки показателя размытости используется метрический подход [2]: определение расстояния d между нечетким множеством, соответствующим результату, и максимально размытым множеством А0
.5d= (2/n) ф r(xi) - r0.5(xi) ф(7)
В нашем случае d = 0.51.
Таким образом, использование программ преобразования распределений позволяет корректно агрегировать вероятностную и нечеткую информацию.
В числе следующих шагов: дальнейшее развитие нечетко - вероятностных моделей для оценки и управления риском, программная реализация алгоритма преобразования "вероятность - возможность" и " возможность - вероятность ", основанного на логарифмических шкалах, сравнение полученных результатов.
Литература
1.
Феллер В. Введение в теорию вероятностей и ее приложения, М, 1984, т.2., 752с.2. Нечеткие множества в задачах управления и искусственного интеллекта. Под ред. Д.А. Поспелова. М., 1986 г., 312 с.
3. T.Hideo at. al. Fault Tree Analysis by Fuzzy Probability, IEEE Transactions on Reliability, pp. 453 - 457.
4. D.Harmanec, G.J.Klir. On Information-Preserving Transformations. — Int. J. General Systems, 1997, Vol.26(3), pp.265-290.
5. Ю.В. Волков, Ю.Д. Макаренков, Вероятностный анализ безопасности перевозок космических ЯЭУ по железным дорогам. - Известия вузов. Ядерная энергетика, 1993, № 2, с.20 - 28.
Site of Information
Technologies Designed by inftech@webservis.ru. |
|